3日目
項目(心理変数)間のネットワーク構造を検討する方法.med[(Epskamp, Borsboom & Fried, 2018)]
ネットワークは,観察可能な変数を表すノード(円)と統計的関係を表すエッジ(線)から構成される
統計的手法によってノード間のエッジを推定する
推定されたエッジをもとにネットワークを図示する
ネットワーク特性の指標を検討する
ネットワークの正確度・安定性を検討する
→(1)サンプルサイズに影響されるので正確度・安定性を検討
→(2)グローバルなネットワーク特性(small worldnessなど)は使えないので,ローカルなネットワーク特性(中心性指標)を用いる
有向ネットワークはエッジに方向性があるネットワーク(左図),無向ネットワークは方向性がないネットワーク(右図)
エッジの矢印は因果関係を示唆しているが,横断データではそれは難しい(→無向ネットワークの利用)
エッジの色 符号を意味しており,青・緑の場合は正,赤の場合は負を表す
エッジの太さ 全体のノードからの影響を考慮した時の2つのノード間の関係の強さ
エッジの長さ エッジの強さの逆数。関係が強ければ強いほど短くなる
無向ネットワークモデルの推定では,ペアワイズ・マルコフ確率場(pairwise Markov random field)がよく使われる(Epskamp, Haslbeck, Isvoranu,& Van Borkulo, 2022)
心理ネットワーク分析の主なペアワイズ・マルコフ確率場のモデルには以下の3つがある
Gaussian graphical model (GGM): 連続変数のデータ(エッジの値は-1から1の範囲)
Ising model: 2値変数のデータ(エッジの値は-∞から∞の範囲)
mixed graphical models (MGMs): 2値・順序・連続変数の混ざったデータ(エッジの値は-1から1の範囲)
\[ \boldsymbol{Y} \sim N\left(\boldsymbol{\mu}, \boldsymbol{\Sigma}\right) \]
元々は磁性体に関する統計力学的モデルだが,2値データのネットワークの記述に使える
2値反応のペアの同時確率をモデル化(Epskamp et al., 2022)
\[\operatorname{Pr}(\boldsymbol{Y}=\boldsymbol{y})=\frac{1}{Z} \exp \left(\sum_{i} y_{i} \tau_{i}+\sum_{<i, j>} y_{i} y_{j} \omega_{i j}\right)%\]
- \(\tau_{i}\) は閾値.med[(どっちの反応が出やすいか)], \(\omega_{i j}\) はノード間の反応の類似度を表す。Zは確率の合計が1になるように機能する
しきい値(Thresholding)
刈り込み(Pruning)
モデル探索(model search)
正則化(regularization)
しきい値(Thresholding)
刈り込み(Pruning)
刈り込みでは,ある基準(p値, false discovery rate, credibility interval, Bayes factor)に基づいて,除去した上で(エッジを0に設定),再推定する
再推定するので,基準以下のエッジを0としたときのネットワークが推定される
モデル探索(model search)
正則化(regularization)
モデルの複雑さに罰則をかけて,ネットワークを疎.med[(sparse)]にする。影響力が弱いエッジはゼロに近づき単純化できる
LASSO .med[(least absokute shrinkage and selection operator)]の一種のGraphical LASSOを使う。罰則の強さの調整は,cross-validation(CV)やEBICを使う
(1)サンプルサイズが300の場合,ネットワーク構造の発見には,正則化が好ましい
(2)サンプルサイズが1000の場合,ネットワーク構造や強いエッジに興味があるなら正則化,特定のエッジに関心があるならモデル探索が好ましい
(3)サンプルサイズが5000の場合,真のネットワークの探索には,モデル探索が好ましい
Isingモデルの場合,小中サンプルサイズでは正則化手法が見やすく,大サンプルサイズでは非正則化手法も使える。現状,MGMsで使えるのは正則化手法のみ
** 順序・非正規変数での注意点.med[(Blanken, Isvoranu & Epskamp, 2022)]**
サンプルサイズ
欠測処理
PRMFのエッジは,2変数以外の影響も考慮した2変数の関係を表す.med[(ネットワーク全体の影響を考慮する)]
エッジの解釈としては以下の2つがある
(1)予測可能性の示唆: 他の変数の影響を考慮しても,ある変数から別の変数が予測できる可能性がある
(2)因果関係の可能性の示唆: 因果の方向性は不明だが,そのエッジにはなんらかの因果的な効果がある可能性はある.med[(逆にいうと,強い理論的予測による仮説検証の結果のような解釈はしない)]
心理ネットワーク分析で使えるネットワークの指標として,以下の中心性指標がある
Strength:あるノードがつながっている全てのエッジの強さの合計。あるノードの全体に対する影響力を示している
Closeness: あるノードと他の全てのノード間の最短経路長の合計の逆数。あるノードがどのくらい間接的な影響を含めて他のノードとつながっているのかを示している
Betweeness: 2つのノード間の最短経路上に,あるノードが何回あるのかを示している。あるノードが2つのノードの経路上でどのくらい重要かを示している
ブートストラップ法による信頼区間をプロットすることでエッジの重みの正確度を検討する .med[(有意性の検討には使わない)]
データのサブセットを用いた場合の中心性指標の安定性を検討する .med[(サンプルサイズを小さくしても安定するか検討,CS係数が0.25未満は不適切であり0.5を超えている必要がある)]
エッジの重みと中心性指標間でブートストラップ差異検定を行って,それらが有意に異なるのかを検討する
※1は必須,2は中心性指標を使う場合,3は目的に合わせて
アムステルダム大学の研究者達が開発した以下のRパッケージで,横断データの心理ネットワーク分析は実施できる
qgraph:ネットワーク推定(GGM)とプロット
bootnet: ネットワーク推定(GGM & Isingモデル),ネットワークの正確度と安定性の検討
psychonetrics:より洗練化した書き方でネットワーク推定(GGM & Isingモデル)
mgm:ネットワーク推定(MGMs)
アムステルダム大学の統計ソフトJASPには,心理ネットワーク分析が入っており,ちょっと試すのに便利
Jordan et al.(2017)が,3404名からGAD-7(不安),PHQ-9(うつ),PHQ-15(身体症状)を収集したデータで試す
Jordan et al.(2017)のデータをダウンロードして,読み込む
GAD-7(不安に関する7項目)のデータを使う。renameで変数名を整理する
bootnetのestimateNetwork()関数で,thresholdとalphaを指定する
GAD-7は4件法で順序変数なので,「corMethod = “cor_auto”」と指定して,自動的にポリコリック相関で推定
psychonetricsパッケージのprune()関数を用いる。psychonetricsはパイプ演算子を使って可読性の高いコードが書きやすい
モデル探索はmodelsearch()で行う
bootnetのestimateNetwork()関数を使って,EBICでパラメータ調整をするGLASSOを使う(「default=“EBICglasso”」を指定する)
bootnetのbootnet()関数を使う。summaryでも推定結果を確認できるが,プロットのほうが確認がしやすい
qgraphパッケージのcontralityPlot関数でプロットできる。デフォルトではStrengthのみが出力されるので,includeで”Strength”, “Betweenness”, “Closeness”の3つを指定する
bootnet()関数を使う。「type = “case”」を指定するとケースドロップ時の安定性を推定できる。statisticsで”strength”, “closeness”, “betweenness”を指定する
CS係数を確認する。StrengthとClosenessはCS係数が0.5を超えているが,Betweenessは低いので,解釈を控える必要がある
bootnetのdifferenceTest()関数を使う
Strengthがgad7bとgad7fで差があるかを検討すると,95%CIが0をまたいでおらず,gad7bはgad7fよりも有意にstrengthが大きい
エッジ間の差の検定結果をプロットする(エッジ間で有意な差がある場合は黒く塗りつぶされ,有意ではない場合は灰色に塗りつぶされる)
Strengthにおけるノード間の差の検定結果をプロットする(ノード間で有意な差がある場合は黒色,有意ではない場合は灰色に塗りつぶす)
関心のあるテーマに近いオープンデータを探して,心理ネットワーク分析を実施してみよう!
関心のあるテーマに関して計算論的精神医学研究の論文を探してみよう!
心理学研究100本のうち再現されたのは39本(Open Science Collaboration, 2016, Science)
引用数が多く効果があるとされた臨床医学研究45本のうち再現されたのは20本(Ioannidis, 2005, JAMA)
1576名の調査から,70%が他の研究者の研究を再現できず,50%が自分の研究の再現もできなかった(Baker, 2016, Nature)
→研究知見を信じていいの?
Chris Chambers著
大塚紳一郎訳
みすず書房
2019年
1.方法の再現可能性: 論文と同じデータに同じ方法を用いて,同じ結果が得られること
2.結果の再現可能性: 新規のデータに同じ方法を用いて,同じ結果が得られること
3.推論の再現可能性: 結果から質的に同じ結論が得られること
→同じデータが難しい・・・
2000-2014年の生物医学論文のうち生データが直接利用可能なのは441本中0本だった(Iqbal et al., 2016)
2015-2017年に出版された生物医学論文のうちデータの入手可能性を記載していたのは,たった18.3%(Wallach et al., 2018)
→データが無ければそもそも不可能・・・
→同じ方法が難しい・・・
Science誌掲載論文では,データとコードの共有していた研究が44%,そのうち再現できたのは26%(Stodden et al, 2018)
Cognition誌掲載論文では,35本中再現できたのは22本(その内11本は再現するのに著者の協力が必要, Hardwicke et al., 2018)。
→データもコードもあっても再現できない・・・
第3者が利用できるようにデータを共有する。機械が読みやすく人も理解しやすい形式でデータを配布する
ヒトから収集したデータを共有する場合は,データ共有に対する同意も必要になる。個人が特定できないように工夫も必要(個人情報を含んでなくても特定できることがある)
コードは第三者が読むことを考えて,その分野で馴染みのある書き方にする(Rの場合は,The tidyverse style guide https://style.tidyverse.org/)
第三者が追跡できるように,実行するコードの順番や説明を入れたり,データがどこにあるか分かりやすいように配置する。
やり方に決まりはないけど,最近はソフトのパッケージ化を意識した整理法が注目されつつある(Research Compendium)。
解析環境(OSやソフト)が違うとそもそも実行もできないor結果が再現できないことがある。
コードだけでなく,解析環境やバージョン情報も公開する。 Dockerを使ってOSやソフトを含んだコンテナを共有する。
追試をする場合に必要な情報が足りないことが多い。心理・社会的介入の臨床試験では,必要な内容がちゃんと記載されている論文は半分以下とも(Grant et al., 2013)。
認知課題も課題がそのまま提供されることは少なく,論文の少ない情報から読み解いたり,著者に確認が必要なことも
→方法が微妙に違うので再現できない?
臨床研究においては,研究報告ガイドラインが整備されてきており,この遵守は,結果の再現可能性を高めることが期待できる。
研究実施にかかわるマテリアルをそのまま公開することも増えている。
心理学や精神医学での実験は,実験室への入室時の対応のようなことでも結果が左右される可能性がある。言語化しにくい情報をビデオなどで共有したりする必要もあるかもしれない(国際的な大規模追試プロジェクトでは行われている)。
OSF:研究の事前登録,プレプリント公開,データとコードの共有,共同プロジェクトなど多岐に渡るサービスを展開
推論の再現可能性: 結果から質的に同じ結論が得られること
統計の不適切な使用:統計的に有意な結果を得るために操作するp-hacking(第一種の過誤が高くなる)
有意な結果に基づいて事後的に仮説設定する(HARKing: Hypothesizing After the Results are Known):序論から結果-考察のストーリーが良くなるように序論(仮説)にさかのぼって調整する。
粉飾:結果は否定的であっても,その解釈を歪めたり一部の結果に焦点をあてて結論を歪める
上記の不適切な研究法は,隠蔽されるがゆえに,推論の再現性を歪める。
統計学的に有意な結果が好まれるので,有意なp値を求めて色々と不適切な研究実践をすること
データ収集中に,統計的仮説検定を行って,有意になるまでデータを足す(N増し)。
たくさんの実験条件やアウトカム変数があるのにもかかわらず,有意になった結果だけ報告する(選択的報告)。
解析において,共変量の調整をおこなって,有意になった結果のみを報告する。
→ p-hackingにより,本来は.05のα水準がインフレする(偽陽性率が上がってしまって,本来の意味と変わる)
→データ収集後に解析をした結果を見てから,仮説を立てるHARKingが行われる。
HARKingは,p-hackingの隠蔽に使われたり,一貫した心地よいストーリーによって研究への確信度を過大評価させてしまう可能性がある。
p-hackingとHARKingのあわせ技は心理学で蔓延しており,論文単体からは検出や確定が難しい。
p-hackingとHARKingに対しては,データ収集前の研究仮説や方法の事前登録(臨床試験登録)が有効。
独立した第2の討論者(Independent second discussant)の追加(Avidan et al., 2019): 論文作成に関わった著者グループの考察に加えて,独立した専門家(独立した第2の討論者)が結果から考察を書いて掲載するという取り組みになる。
→英国の麻酔科の雑誌で提案されて,試みは始まっている(早速,著者(Sieber et al., 2019)と第2の討論者(Vlisides et al., 2019)で結論が異なった)。
Japanese Community for Open and Reproducible Science (JCORS):透明性の高い研究を行う上での情報を提供することを目的としたオンラインプラットフォーム https://osf.io/z4cgu/
ReproducibiliTea:世界的に行われている再現可能性を学ぶ抄読会(日本ではReproducibiliTea FukuokaとReproducibiliTea Tokyoがある)
心理学評論の再現性に関する特集号:(1)「心理学の再現可能性」Vol.59 No.1 2016年, (2)「統計革命」Vol.61 No.1 2018年,(3)「心理学研究の新しいかたち」Vol62. No.3 2020年
OSFのアカウントを作成してみよう!
関心のあるテーマに近い研究の事前登録を探して読んでみよう!